IBM Watson Explorer 2에 대한 분석 컬렉션 만들기 -라면 상점이 그것을 지옥락 뉴토끼한다면

지옥락 뉴토끼

IBM Watson Explorer Analytical Components (WEXAC)는 Watson 솔루션의 기초로 배치되어 있으며 텍스트, 데이터베이스, 웹 등에 포함 된 구조화 및 구조화되지 않은 콘텐츠를 수집하고 지옥락 뉴토끼하는 강력한 텍스트 마이닝 도구입니다

이전 기사에서, 우리는 설문 조사를 지옥락 뉴토끼하려는라면 레스토랑이 wexac (픽션)을 시험해 볼 것이라는 간단한 컬렉션을 만들었습니다

이번에는 사용자 정의 텍스트 지옥락 뉴토끼 규칙을 사용하여 더 많은 컬렉션을 만들고 싶습니다

연설의 일부 확인

나는 수입 된 문장의 연설 부분을 점검했다

지옥락 뉴토끼

"형용사"패싯을 보면 "나는 그것을 원한다", "나는 그것을 원한다", "나는 그것을 좋아한다"및 "행복"과 같은 요구로 이어질 수있는 단어가있다 우리는 당신이 원하는 것과 당신이있을 때 행복하다고 느끼는 것을 추출하려고 노력할 것입니다

사용자 정의 텍스트 지옥락 뉴토끼 규칙 설정

먼저, 패싯 트리에 "요청"패싯을 만듭니다 그런 다음 사용자 정의 텍스트 지옥락 뉴토끼 규칙을 설정하십시오 지옥락 뉴토끼 및 인덱스 창에서 지옥락 뉴토끼 리소스 사용자 정의 텍스트 지옥락 뉴토끼 규칙을 선택하십시오

규칙 파일 이름을 입력하고 (이번에는 "Pat_Request") "열기"버튼을 누릅니다

나는``내가 원한다 ''고 간단히 말하는``● ●● ''를 시도하고 추출하고 싶습니다 규칙은 XML 형식으로 입력됩니다

・ 패싯 패싯 경로 카테고리에 표시하는 경로 (이번에는 패싯 패싯 패싯 패싯 패싯 패싯)

・ 값 값으로 표시하려는 내용 값으로 표시 할 내용 (이번에는 "●●"표시되므로 해당 요소를 나타내는 $ 0lex

각 요소를 정의해야하므로

・ "●●": 명사 (id =”0 ″ POS =”NOUN”

・ "ga": 단어 "ga"(id =”1 ″ lex =”is ")

・ "나는 원한다": 단어 "나는 원한다"(id =”2 ″ lex =”I ant "

로 정의하십시오 규칙을 입력하고 "확인"버튼을 누릅니다

지옥락 뉴토끼 리소스를 배포하고 인덱스를 만들고 컨텐츠 지옥락 뉴토끼 광부가 완료된 후 확인하십시오 "●●"에서 "● ● ● ● ● ●"가 "요청"패싯에 표시됩니다

그러나 상황이 계속되면````● ● ● ''문장 만 얻을 수 있습니다``내가 원합니다 ● ● ● ●``문장을 보면 "누군가를 원한다"라는 문장에 대해서도 "누군가를 원한다"또는 "나는 누군가를 좋아하는 사람을 원합니다"라고 말하는 다양한 패턴이있는 것 같습니다

규칙을 추가하여 취할 수있는 문장 패턴의 수를 늘리십시오 복합 명사, 입자 및 형용사의 패턴을 늘리십시오

지옥락 뉴토끼 리소스를 배포하고 인덱스를 만들고 컨텐츠 지옥락 뉴토끼 광부가 완료된 후 확인하십시오 우리는 이제 이전보다 요청 된 더 많은 단어를 추출 할 수 있습니다

이번에는 사용자 정의 텍스트 규칙 지옥락 뉴토끼 설정을 추가 컬렉션을 만드는 방법 중 하나로 간단히 다루었습니다 Wexac에는 다양한 다른 기능이 있으므로 기회가 있으면 다양한 기능을 사용해보십시오

연락처 정보

저자 프로필

Kimoto Yurie
Kimoto YurieTDI AI/Cognitive Promotion Department
나는 주로 IBM Watson Explorer 지옥락 뉴토끼 구성 요소 관련 작업에 관여합니다 나는 지금 흥미로운 것을 시작하려고 노력하고 있습니다 현재 Kaggle을 시도합니다

관련 기사